查看原文
其他

主题演讲实务分享 | AIGC:产业与法律合规的深度分析

王捷 资深出海法律顾问 出海互联网法律观察
2024-08-25


W&W国际法律团队

专注互联网出海法律实务:

W&W国际法律团队深耕海外多地区多条业务线,通过多年来积累的出海法律服务经验以及资源优势,结合本土化的合规经验与国际化的思维,致力于为出海互联网企业提供专业的一站式法律解决方案,为逐鹿海外的互联网企业提供优质及多元化的法律服务,为各类新型业务搭建运营合规体系及提供有效的风险评估及合规解决方案。


互联网前沿领域法律服务:

W&W国际法律团队深耕出海法律实务的同时,也紧跟互联网前沿动态,可以为互联网企业提供前沿领域的法律服务,为企业开拓新的业务领域保驾护航,比如AIGC产品全链路合规法律服务,包括AI与数据合规, AIGC与知识产权布局、侵权风险防范,内容审核标准制定等。


覆盖以下行业领域:

物联网、智能家居、智能汽车、车联网、芯片制造、Web3.0、NFT、AI、电子设备及智能终端制造、数字化安全、IOT、云计算与服务、社交网络平台、电子商务、短视频视听直播、网络游戏、人力资源等行业领域。


(此处仅展示部分内容,如有任何需求,请尽管与我们联系。)



文/W&W国际法律团队


引言


2023年9月23日,由广东省法学会信息通信法学研究会主办,东莞市法学会承办,华南师范大学新时代法治广东建设研究中心协办的“中国式现代化背景下人工智能与数字产业法律治理研究”学术研讨会暨信息通信法学研讨会2023学术年会在东莞市成功举办。省法学会副会长于敏,省法学会副会长、信息通信法学研究会会长张永忠,省法学会四级调研员钟婉曼,东莞市政务服务数据管理局副局长陈钊,东莞市法学院副会长陈锡康及省内多名专家学者出席了会议。


垦丁 (广州) 律师事务所执行主任、W&W国际法律团队创始人王捷律师荣幸受邀出席会议并作主题发言。围绕“AIGC产业与法律合规”问题,王捷律师对AIGC的概念界定、应用实践、商业模式、部分合规风险四个方面进行了深入分析。


本文对王捷律师的发言内容进行系统梳理,并深入探究AIGC的法律合规要点,以飨读者。


01

AIGC的概念:

技术变革与数字化下的生成式网络信息内容


AIGC全称为AI-Generated Content,直译为人工智能生成内容,生成内容包括文本、图像、视频、音频等。


目前对于AIGC尚无统一规范的定义。2022年9月,中国信通院和京东探索研究院共同发布了《人工智能生成内容(AIGC)白皮书》,将AIGC定义为“既是从内容生产者视角进行分类的一类内容,又是一种内容生产方式,同时还是用于内容自动化生成的一类技术集合”。


该定义认为AIGC兼有内容特征和技术特征两个方面,总体上可以将AIGC概括为AI技术变革和数字化下的生成式网络信息内容。


02

AIGC的应用实践:

AIGC涉及的典型行业与场景


A

传媒

在传媒领域,AIGC作为一种新兴技术,不仅可以在文本层面生成内容,还可以生成图片、视频等多种形式的内容。在虚拟主持人、虚拟主播方面,AIGC已经可以实现语音合成和视频生成,并且可以实现观众与主持人、主播之间的实时活动。


B

电商

在电商领域,目前也出现了为客户推荐商品、讲解卖点的AI导购。Secoo集团通过引入OpenAI的GPT及百度的文心一言,推出了智能营销模式。


C

 金融

在投融资领域,2023年3月,GPT-4发布之际,摩根士丹利便宣布其通过OpenAI的GPT-4,为内部的知识库引入全新的查找信息的方式。


D

其他

AIGC所适用的行业不仅局限于我们以上列出的行业,包括教育、医疗、设计、工业等多个行业,AIGC亦发光发热。


03

AIGC的商业模式:

开源、订阅制与按量计费


现有AIGC服务的商业模式,可分为开源、订阅制、按量计费三种模式。

详见下述分析:


A

开源

Stable AI的Stable Diffusion、Big Science的Bloom模型,采用开源的方式进行公布,不同模型采用了不同的许可证,对模型的使用进行了不同程度的限制或许可。

图1 开源模式下不同模型的授权范围


B

订阅

部分AIGC产品采用了订阅制的商业模式。以OpenAI的ChatGPT为例,目前ChatGPT支持免费和按月付费20美元的两种计费方式。用户订阅月费20美元的服务后,可以使用基于OpenAI最新的、最可靠的GPT-4模型的ChatGPT,且可以使用ChatGPT Plugins实现例如订餐、查询机票、文献检索等功能。


C

按量计费

按量计费的模式普遍面向开发者,开发者可使用服务提供商的API、将AIGC服务接入自己的应用,并按照实际的使用量进行计费。以OpenAI的GPT-3.5 turbo为例,处理1000个Token(包括输入的提示词和输出的内容)的费用为0.002美元。对于GPT-4,则进一步区分8K context和32K context两种,收取不同的费用。

图2 OpenAI提供的API的计费方式


04

AIGC的部分合规风险


A

知识产权合规


1. 数据采集和训练阶段面临的合规风险


AIGC所采集的数据来源于包括但不限于公共数据集、公共网站、自有数据、众包数据、合成数据等数据源,作为在大量不同数据集上训练出来的模型,如使用受著作权保护的数据来训练人工智能模型,AIGC 的文本数据挖掘技术可能导致其在他人享有著作权的作品中“借鉴”部分内容。


案例分享

2023年1月13日,三名插画师Sarah Andersen、Kelly McKernan和Karla Ortiz对Midjourney Inc.、DeviantArt Inc.(推出 DreamUp 的公司)以及Stability A.I. Ltd(推出 Stable Diffusion 的公司)提起了诉讼,这是首例有关AIGC数据训练侵权案。三名插画师指出,上述公司在未经过他们同意或提供补偿的情况,使用他们的艺术作品进行数据训练。该案指出,当 Stable Diffusion 根据其用户的提示生成图像时,它使用训练图片通过软件处理生成看似新的图像。这些所谓“新”的图像完全基于训练图片,并且是根据 Stable Diffusion 在组装给定输出时使用的特定图片的二次创作。


2. 数据收集和训练阶段的免责事由


1)合理使用

合理使用制度是允许使用者在某种特定的情况下使用受版权保护的作品而不需要获得著作权人的授权或支付费用。这个原则在各国版权法中被广泛应用,它的目的是平衡版权持有人的权益和公众利益。


根据美国版权法,使用公开可用数据库的数据才有可能构成合理使用,具体需满足如下条件:

  • 提取数据者是数据库的合法用户;

  • 提取数据是为了教学或研究目的,并非商业目的;

  • 使用时标明数据来源。


我国《著作权法》第二十四条有关“合理使用”的规定包括十三种情形,但是,有关AIGC的应用面向广泛领域的用户,其现有商业模式和应用,并不符合合理使用的规定,因此难以通过合理使用主张免责以规避风险。


2)Text and Data Mining (TDM)

Text and Data Mining(有限文本和数据挖掘,TDM)是指一种在英国版权法中的例外情况,它允许人们在一定的情况下使用受版权保护的文本和数据进行挖掘,而不需要获得版权持有人的授权或支付版权费用。


欧盟则于2019年正式通过Directive on Copyright in the Digital Singles Market(《单一数字市场版权指令》),创设文本与数据挖掘(TDM)的例外,以支持数据科学和人工智能的发展。但如果权利人以适当的方式明确保留对作品或其他客体的使用,则不适用该例外。


3)获取知识产权权利人的授权

如果对作品的使用既不构成“合理使用”,也无法满足TDM的规定,规避侵权风险的路径则须考虑传统的路径——获取知识产权权利人的授权。但目前AIGC大模型背景下,取得知识产权权利人的授权可能性较低。AIGC产业发展与现有知识产权保护的平衡之道仍有待探索。


3. 输出内容阶段面临的合规风险


输出内容时的知识产权风险指的是AIGC生成的内容侵犯了他人的知识产权,例如侵犯了原作品的版权等。这种风险通常是由于AIGC生成的内容与已有作品过于相似或几乎一致导致的。AIGC是否构成对他人知识产权的侵犯,构成对何种著作权具体权能的侵犯,需根据实质相似标准作相应判断。


B

数据流转合规

如W&W国际法律团队在本文先前所述,目前AIGC的商业模式分为开源、订阅制、按量计费三种模式。企业/组织用户在使用AIGC时,普遍采用开源模式和按量计费模式,下文对这两种模式涉及的数据流转问题进行分析:

图3 W&W国际法律团队在过往客户案例中总结的某场景的数据流转图


1. 开源模式下的数据流转合规


对于开源的AIGC模型,模型部署者需要将模型部署在自有或者云服务供应商的数据中心中,因此输入的提示词(“Prompt”)和输出的生成内容(“Completion”)等数据将流转于数据中心与服务使用者之间。


模型部署者为符合法律法规要求,如保存记录、过滤输入输出等,可能选择在模型前面添加一层服务(以下简称为“服务层”)用于记录日志、监测违规内容等,此时用户的输入将先经过服务层,服务层再将输入发送至模型(以下简称为“模型层”)。模型层中,AIGC模型将根据输入的提示词,输出生成的内容并发送回服务层,服务层再将生成的内容发送回用户。


企业在自部署AIGC模型,可考虑服务器运维成本、网络延迟、目标国家法律法规的要求等,若运行服务层和模型层的代码的服务器位于不同的国家或地区,应当注意涉及数据的跨境传输问题。


2. 按量计费模式下的数据流转合规


根据垦丁W&W国际法律团队服务的过往客户的案例,并非每个公司都会选择自行部署AIGC模型,大多数公司会选择使用市场上较为成熟的模型的对外API、按量计费的服务,如OpenAI的GPT-4或者Anthropic的Claude。此类服务的服务器一般部署于西欧以及北美。而运行服务层代码的服务器可能根据公司产品的目标市场的法律法规、服务器延迟等多种因素,被部署在不同的国家或地区,服务层与模型层之间的数据流转可能涉及数据跨境。


C

网络安全合规

目前的AIGC模型,在训练或使用的过程中均需要消耗大量的计算资源(主要是GPU、内存)。根据我们的观察,OpenAI在训练GPT时便使用了分布式人工智能框架Ray以解决其复杂的计算需求。


使用分布式训练或分布式处理时,模型所部署的服务器可能位于不同的数据中心,服务器之间的通信需要使用到广域网或互联网,不法分子可能截取服务器之间的通信并篡改,从而最终影响AIGC模型的权重、甚至是整体性能。因此,使用第三方云服务提供商的服务器进行训练的公司,应该确保在分布式训练或分布式处理时,依照适用国家的网络安全相关的法律法规,对服务器之间的通信进行加密。


D

反不正当竞争合规

训练AIGC模型,需要海量的数据作为训练数据。主流的数据集如Common Crawl、Wikipedia、WebText2等,均采用爬虫的技术进行收集。若企业选择自行组建数据集而非选择已公开的数据集,在使用爬虫时应当考虑包括但不限于爬虫的性质、爬取的方式爬取数据的频率、网站的robots协议等,以免因爬取行为构成不正当竞争而承担赔偿责任。


E

内容合规

尽管部分AIGC模型已经判断用户输入的提示词是否违反服务协议、行为准则等,从而一定程度上避免输出违反某个国家的法律法规的内容,但实践中仍然无法百分之百避免模型输出违法违规内容。因此,提供AIGC服务的企业和组织可能需要对用户输入模型的内容和模型生成的内容进行监控和管理,以防止违法行为发生。


F

个人信息保护合规

ChatGPT于2023年3月,曾因未就收集处理用户信息进行告知、缺乏处理个人信息的法律依据,而被意大利个人数据保护局禁用。其后,ChatGPT进行了一系列整改,包括修订隐私政策、增加用户行使删除权的路径、提供关闭内容记录的方式等,最终得以在意大利重新开放。


考虑到目前提供AIGC服务或产品的公司大都位于美国,此类公司起草隐私政策时往往采用美国标准的隐私政策,并未考虑到GDPR或UK GDPR的相关规定,导致可能被欧盟或英国的数据保护监管机构进行处罚。


企业在面向多个国家或地区提供服务时,应当关注全球不同国家或地区的个人信息保护立法的不同要求,结合目标国家或地区的特殊立法要求或执法动态,采取对应合规措施,包括增加隐私政策附录、签署数据处理协议等。在过往案例中,垦丁W&W国际法律团队已为不同公司、同时在不同目标国家或地区上线产品,起草或修订隐私政策或其他数据相关协议,结合目标国家或地区的数据隐私立法和执法进行相应增加或修改目标国际条款,有效防范企业因违反目标国家个人信息保护相关规定而被处罚的风险。


结语


AIGC作为AI与大数据、云计算等多技术领域结合的产物,其实践的规范化与合规化已成为企业和组织不可或缺的一部分。在运用AIGC技术提供服务时,企业和组织将面临来自不同国家在知识产权合规、数据传输合规以及个人信息保护合规等多方面的挑战,如何合法合规运用AIGC提供服务,将成为企业和组织需要回答的问题。


在过往案例中,垦丁W&W国际法律团队成功地为不同公司实现了跨国业务上线,包括起草或修订了隐私政策和其他数据相关协议、对企业的数据处理流程进行全面评估、提供专业的法律意见和建议,帮助客户在与合作伙伴的数据共享和处理中降低法律风险,以有效地防范企业因违反目标国家个人信息保护相关规定而面临处罚的风险。

W&W国际法律团队已发表《AIGC产业发展与法律合规实务手册》 (第一版),我们持续关注AIGC的发展和实践,并正在对本报告进行更新,后续将持续输出更多深入版本的内容,如需手册全文,欢迎大家扫描下方二维码,关注本公众号,在后台输入“AIGC”获取PDF版本。





主编介绍


王 捷 律师

垦丁国际业务部负责人、广州执行主任

W&W国际法律团队创始人

荣登律商联讯(LexisNexis)2023「40位40岁以下的法律精英」榜单


业务领域:

个人信息保护与全球数据合规、数据合规、互联网与网络法实务合规、企业出海合规、网络安全


王律师持有CIPP/E(国际信息隐私专家认证/欧盟)、区块链应用操作员资格证书、数据安全师、数据合规官资格证书,是联合国世界丝绸之路委员会专家,中国国际贸易促进委员会深圳调解中心专家调解员,广东省法学会信息通讯法学研究会理事,荷兰RuG国际经济法与商法硕士。


王律师曾在阿里巴巴大文娱集团、国际律所与海外仲裁委员会工作积累了12年+科技型公司实务经验,具备中外律所从业背景。专业能力模块包括产品风险管控、业务流程搭建、竞对攻防布局、政府监管合规、海外公司治理等。王律师已为多家头部与一线的知名互联网公司、大中型外资企业及大型国企提供专业法律服务,行业覆盖物联网、智能终端制造、IOT、云计算与服务、社交网络平台、电子商务及平台、智能汽车与车机系统、芯片制造业、网络游戏、Web 3.0、NFT、AI、以及GPT等新兴领域。


王律师擅长解决由互联网、数据及智能技术引发的数据安全风险与合规解决方案落地,包括数据保护与合规、产品风险管控、业务流程搭建、风险分析评估、政府监管合规、竞对攻防布局,已为各类涉互联网企业拓展全球市场提供法律支持,尤其擅长为企业出海欧美、东南亚、印度、日韩、中东、中国港澳台地区等新兴及重要市场提供有效的合规解决方案与落地支持。


同时,王律师独著《Comparison of Various Compliance Points of Data Protection Laws in Ten Countries/Regions》,在全球最高分的六篇论文中,荣获国际知名隐私组织FPF第 12 届政策制定者年度隐私论文奖,该文章同时被评为年度隐私政策制定者“必读”文章。其耕笔的多篇互联网与数据合规文章收录于国际知名专业数据库。


联系方式:jie.wang@kindinglaw.com

+86 13650790754 





推荐阅读:

垦丁荣誉|王捷律师荣登律商联讯2023年 “40位40岁以下的法律精英”榜单

W&W国际法律团队 | 欧盟-美国隐私框架「DPF」解读全系列

W&W国际法律团队 | 印度2023数字个人数据保护法案最新要点解读

挥毫泼墨谱合规 | 2023《全球数据合规法律观察报告》重磅发布

合规实务 | AIGC非知识产权领域的法律风险与合规应对

合规实务 | AIGC知识产权领域的法律风险与合规应对

要点分析 | 欧盟Artificial Intelligence Act 解读(二)

要点分析 | 欧盟Artificial Intelligence Act 解读(一)

要点分析 |  中国《生成式人工智能服务管理办法(征求意见稿)》解读

重榜发布  | 《AIGC产业发展与法律合规实务手册》(第一版)

重磅蓝皮书 | 《中国个人信息保护法与海外多国/地区数据合规法律企业合规要点比较报告》发布

2023年中重磅 | V4.0版《个人信息保护与数据合规法律汇编》如期而至

欧洲观察 | 英国:ICO就生物识别数据指南发起公众咨询

美洲观察 | 巴西:ANPD就数据传输和标准合同条款范本的决议征求公众意见

北美观察 | 美国:FPF向FTC提供有关使用隐私保护面部年龄估算作为可验证监护人同意机制的意见

亚太观察 | 印度尼西亚:通信与信息部(Komifo)就数据保护法实施条例草案征求公众意见




继续滑动看下一个
出海互联网法律观察
向上滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存